检索结果

Select

1. 融合多时间尺度和特征加强的知识图谱推荐模型

张素琪, 王鑫鑫, 佘世耀, 顾军华

《计算机应用》唯一官方网站 2022, 42 (4): 1093-1098. DOI: 10.11772/j.issn.1001-9081.2021071241

摘要（355）

HTML （15）

PDF （582KB）（201）

针对现有的知识图谱推荐模型没有考虑到用户的周期特征以及待推荐项目会对用户近期兴趣产生影响的问题，提出一种融合多时间尺度和特征加强的知识图谱推荐模型（MTFE）。首先，采用长短期记忆（LSTM）网络在不同时间尺度上挖掘用户的周期特征并融入到用户表示中；然后，通过注意力机制挖掘待推荐项目中与用户近期特征相关性较强的特征，将其加强后融入项目表示中；最后，通过评分函数计算用户对待推荐项目的评分。在真实数据集Last.FM、MovieLens-1M和MovieLens-20M上把所提模型和个性化实体推荐（PER）、协同知识嵌入（CKE）、LibFM、RippleNet、知识图卷积网络（KGCN）、协同知识感知注意网络（CKAN）等知识图谱推荐模型进行对比。实验结果表明，在三个数据集上MTFE相较于表现最优的对比模型的F1性能分别提升了0.78、1.63和1.92个百分点，AUC指标在三个数据集上分别提升了3.94、2.73和1.15个百分点。可见，所提模型相较于对比图谱推荐模型有更好的推荐效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 融合协同过滤信息的知识图注意力网络

顾军华, 王锐, 李宁宁, 张素琪

《计算机应用》唯一官方网站 2022, 42 (4): 1087-1092. DOI: 10.11772/j.issn.1001-9081.2021071269

摘要（343）

HTML （13）

PDF （558KB）（146）

知识图谱（KG）能够缓解协同过滤算法存在的数据稀疏和冷启动问题，在推荐领域被广泛地研究和应用。现有的很多基于KG的推荐模型混淆了用户物品二部图中的协同过滤信息和KG中实体间的关联信息，导致学习到的用户向量和物品向量无法准确表达其特征，甚至引入与用户、物品无关的信息从而干扰推荐。针对上述问题提出一种融合协同信息的知识图注意力网络（KGANCF）。首先，为了避免KG实体信息的干扰，网络的协同过滤层从用户物品二部图中挖掘出用户和物品的协同过滤信息；然后，在知识图注意力嵌入层中应用图注意力机制，从KG中继续提取与用户和物品密切相关的属性信息；最后，在预测层将用户物品的协同过滤信息和KG中的属性信息融合，得到用户和物品最终向量表示，进而预测用户对物品的评分。在MovieLens-20M和Last.FM数据集上进行了实验，与协同知识感知注意力网络（CKAN）相比，KGANCF在MovieLens-20M数据集上的F1分数提升了1.1个百分点，曲线下面积（AUC）提升了0.6个百分点；而在KG相对稀疏的Last.FM数据集上，模型的F1分数提升了3.3个百分点，AUC提升了8.5个百分点。实验结果表明，KGANCF能够有效提高推荐结果的准确度，在KG稀疏的数据集上显著优于协同知识嵌入（CKE）、知识图谱卷积网络（KGCN）、知识图注意网络（KGAT）和CKAN模型。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于知识图偏好注意力网络的长短期推荐模型及其更新方法

顾军华, 樊帅, 李宁宁, 张素琪

《计算机应用》唯一官方网站 2022, 42 (4): 1079-1086. DOI: 10.11772/j.issn.1001-9081.2021071242

摘要（455）

HTML （27）

PDF （785KB）（174）

目前，知识图谱推荐的研究主要集中在模型建立和训练上。然而在实际应用中，需要使用增量更新方法定期更新模型来适应新用户和老用户偏好的改变。针对大部分该类模型仅利用用户的长期兴趣表示做推荐，而没有考虑用户的短期兴趣且聚合邻域实体得到项目向量表示时聚合方式的可解释性不足，以及更新模型的过程中存在灾难性遗忘的问题，提出基于知识图偏好注意力网络的长短期推荐（KGPATLS）模型及其更新方法。首先，通过KGPATLS模型提出偏好注意力网络的聚合方式以及结合用户长期兴趣和短期兴趣的用户表示方法；然后，为了缓解更新模型存在的灾难性遗忘问题，提出融合预测采样和知识蒸馏的增量更新方法（FPSKD）。将提出的KGPATLS模型和FPSKD方法在MovieLens-1M和Last.FM两个数据集上进行实验。相较于最优基线模型知识图谱卷积网络（KGCN），KGPATLS模型的曲线下面积（AUC）指标在两个数据集上分别有2.2%和1.4%的提升，准确率（Acc）指标分别有2.5%和2.9%的提升。在两个数据集上对比FPSKD与三个基线增量更新方法Fine Tune、Random Sampling、Full Batch，FPSKD在AUC和Acc指标上优于Fine Tune、Random Sampling，在训练时间指标上FPSKD分别降低到Full Batch的大约1/8和1/4。实验结果验证了KGPATLS模型的性能，而FPSKD在保持模型性能的同时可以高效地更新模型。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 求解最大团问题的并行多层图划分方法

顾军华, 霍士杰, 武君艳, 尹君, 张素琪

计算机应用 2018, 38 (12): 3425-3432. DOI: 10.11772/j.issn.1001-9081.2018040934

摘要（572）

PDF （1254KB）（346）

在当今大数据环境下，针对图中节点的海量性和分析的复杂性对最大团问题的研究在速度和精度上都提出了更高要求的问题，提出求解最大团问题的并行多层图划分方法（PMGP_SMC）。首先，提出一种新的多层图划分（MGP）方法，在保持原有图的团结构不被破坏的情况下对大规模图例划分产生子图，并对规模较大的子图进行多层图划分，进一步缩小子图规模，并且应用GraphX图计算框架实现MGP，形成并行MGP（PMGP）方法；然后，依据划分后的子图规模，减少了惩罚值局部搜索算法（PBLS）的迭代次数，提出基于速度优化的PBLS（SPBLS）来求解划分后的各个子图的最大团；最后，将PMGP和SPBLS相结合形成PMGP_SMC。采用Stanford大规模数据集运行测试，实验结果表明，PMGP相比并行单层图划分方法（PSGP），求得的最大子图规模能缩小至原来的1/100，平均子图规模能缩小至原来的1/2；PMGP_SMC相比求解最大团问题的PSGP（PSGP_SMC），总体时间缩短至原来的1/100，并且PMGP_SMC求解最大团的精度和基于极大团枚举求解最大团问题的并行多层图划分方法（PMGP_MCE）一致。PMGP_SMC能够快速精准地求解大规模图例的最大团。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于Spark的并行FP-Growth算法优化及实现

顾军华, 武君艳, 许馨匀, 谢志坚, 张素琪

计算机应用 2018, 38 (11): 3069-3074. DOI: 10.11772/j.issn.1001-9081.2018041219

摘要（972）

PDF （928KB）（635）

为了进一步提高在Spark平台上的频繁模式增长（FP-Growth）算法执行效率，提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先，从频繁模式树（FP-Tree）规模大小和分区计算量对F-List分组策略进行改进，保证每个分区负载总和近似相等；然后，通过创建列表P-List对数据集划分策略进行优化，减少遍历次数，降低时间复杂度。实验结果表明，BFPG算法提高了并行FP-Growth算法挖掘效率，且算法具有良好的扩展性。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于Hadoop的IPTV隐式评分模型

顾军华, 官磊, 张建, 高星, 张素琪

计算机应用 2017, 37 (11): 3188-3193. DOI: 10.11772/j.issn.1001-9081.2017.11.3188

摘要（538）

PDF （867KB）（456）

根据网路协定电视（IPTV）用户收视行为数据中的隐式特性，提出一种新型的隐式评分模型。首先，介绍了IPTV用户收视行为数据的主要特点，提出一种新的用户收视比值、用户兴趣偏置因子以及视频类型影响因子相结合的多特征混合隐式评分模型；然后，提出基于收视时长和收视比值的收视行为筛选策略；最后，设计并实现了基于Hadoop的分布式模型架构。实验结果表明，所提模型有效提高了IPTV系统中推荐结果的质量，同时提升了时间效率，对于大规模数据有良好的可扩展性。

参考文献 | 相关文章 | 多维度评价

Select

7. CCML2017+会议编号352+基于Hadoop的IPTV隐式评分模型

顾军华官磊张建高星张素琪

录用日期: 2017-07-05